服务器配置流程说明
需求
1.多用户远程登录,考虑到需要多人同时使用服务器,向日葵等软件无法满足需求,因此必须使用SSH远程连接账号。
2.深度学习训练环境,主要是安装GPU的驱动和cuda。
3.数据安全,将系统盘和数据盘区分开,以防止重装系统导致数据丢失。
多用户远程登录
步骤一:安装SSH
sudo apt-get install openssh-server
步骤二:启动SSH
sudo service sshd start
步骤三:设置固定IP
服务器的IP是随机动态分配的,动态IP对于SSH造成了挑战,因此需要将IP更新从DHCP改为手动,同时设置掩码,网关和DNS。 先研院和科大属于同一局域网,但是先研院和科大之间存在墙,因此无法在科大内部直接对服务器进行SSH,所以需要联系机房老师开放特定的端口进行访问。
步骤四:远程访问
●局域网内登录
使用Mobaxterm软件远程访问 用户名@IP地址:端口号
●局域网外登录
首先布置内网穿透,可以使用Cpolar,网站上有详细教程。
用户名@域名:端口号
配置深度学习训练环境
●图形化界面下驱动安装
点击软件更新,再点击附加驱动,选中合适的版本就可以了
●命令行安装方法
sudo apt update
sudo apt upgrade
ubuntu-drivers devices
sudo apt install 推荐版本#安装GPU驱动
nvcc -V#查看cuda是否存在,不存在再按照提示安装
数据安全
可能会多次重装系统,每次重装系统都可能会导致数据格式化,因此我们需要把系统盘和数据盘分开,每次重装系统仅需要格式化系统盘即可。 主要分为两个流程,永久挂载硬盘和指定用户home
● 永久挂载硬盘
步骤一:查看硬盘信息
sudo blkid //查看你的硬盘编号、UUID,如sda,sdb 等
步骤二: 将硬盘挂载信息写入启动文件/etc/fstab
vim /etc/fstab
UUID=XXXXXXXXXXX /home ext4 defaults 0 0
只需要挂载sdb2的UUID,不要挂载sdb1,否则会导致无法开机.直接挂载到home路径。如果无法写入/etc/fstab,就切换到root
步骤三: 挂载检查并重启
写入/etc/fstab后使用下面命令自动挂载,然后重启服务器
mount -a#自动挂载
df -h#挂载检查
● 指定用户home
以下步骤仅适合重装系统后要保留原先用户数据的场景,通过以下步骤可以直接使用先前的conda环境等内容
步骤一: 修改硬盘读写权限
chmod 777 挂载点
步骤二:创建新用户
useradd -d home路径 用户名#指定新用户的home路径
passwd 用户名
或
usermod -d home路径 用户名#创建后将已经在的路径指定为home
可以使用以下命令查看home目录
pwd
步骤三: 修改文件夹所有者
chown -R 所有者 home路径#重装系统后已有的文件夹虽被指定为特定用户的home路径,但是文件夹的所有者还是usr,需要更改
步骤四: ‘修改文件夹权限
chmod 700 home路径#仅所有者可读可写
步骤五:解决useradd添加新用户,登陆后显示$
登陆管理员账户
sudo usermod -s /bin/bash username